查看原文
其他

【疯狂7月】⑤—免费在线小工具:双表合并 | 云平台

联川生物 2024-03-27

The following article is from HellsegaMosken Author HellsegaMosken


“联川书籍”火热销售中,《单细胞测序研究一本通2.0》新鲜出炉,

详情请戳:小伙伴们!《单细胞测序研究一本通2.0》新书发售~

扫描上方二维码,看更多书籍↑

悄咪咪告诉你,参与下方活动即可获得哦


疯狂7月,您点单,我开发还有礼品拿。

联川书籍免费领,7月限定!

详情请戳:“疯狂7月”活动:你提交,我开发 | 云平台



云工具:fasta序列提取 https://www.omicstudio.cn/tool/77
中奖用户:微信号pancc19*
云工具:mantel相关性分析 https://www.omicstudio.cn/tool/62
中奖用户:微信号chenhan-_-*
云工具:表格ID信息去重 https://www.omicstudio.cn/tool/79
中奖用户:153****7963
云工具:表格信息提取   https://www.omicstudio.cn/tool/78
中奖用户:180****1798


请中奖用户在后台留言您想要的书籍,地址和联系方式,记得速速联系小编哦!
活动名额有限(仅剩16个送书名额),赶紧来开发你的专属云工具吧~
活动持续火热进行中,20个云工具已经开发到第5个咯~
一起来期待第六弹吧,酷暑夏日和联川来一次超级联动吧~~

前言

之前介绍过生信操作中常用的两种表格操作工具:

  1. 提取表格中的ID信息:不会用VLOOKUP批量提取表格信息?鼠标操作轻量小工具助力科研!)

  2. 生信绘图必备的ID合并工具:(免费在线小工具:表格ID信息去重


今天我们介绍另一个表格处理小工具,可以配合使用哦。


云工具

https://www.omicstudio.cn/tool/80



应用场景

生信分析中经常需要合并两张表,本工具可以根据两表中包含相同信息的列来合并两表。
常见的应用场景:
1.基因注释 - 如一张表是基因表达量,一张表是数据库下载的基因信息,合并就相当于是基因注释;
2.关联分析 - 如一张表是转录数据,一张表是蛋白数据,当二表都有基因列时可以用此云工具。


格式说明

两张表必须有一列内容是对应的(列名可以不同), 会根据此列中相同的内容将两表合并起来。


示例数据

如下图所示,是两张示例数据,左表是基因差异分析结果,右表是基因的KEGG注释信息。两表有一列共同信息(红框所示),均为基因的Ensembl数据库的基因ID。我们的目的是合并两表,相当于是对差异分析做KEGG数据库注释,这样我们可以在一张表中查看差异表达和对应的通路信息。


选择对应列

如下图,分别选择表1和表2的对应列。此工具会依据此列将两表进行合并。


如果选择的信息不合适,会进行提醒:


选择合并方式

依据您的分析需求来进行合并即

以左表为准:保留左表所有值

我们看下合并效果:左表(下左)的总行数是60612,合并后(下右)有81503行,那么多出来的行是哪里来的呢?


首先,结果中包含了原左表的所有值。同时,右表中的对应列有重复的基因,因为一个基因可能不止一个通路注释,由此导致同一个基因占了多行。需要注意的是,如果左右表的值都有重复,那么合并结果会更多,如:左表中gene1出现了2次,右表中gene1出现了3次,那么合并后gene1会出现2*3=6次(即进行排列组合)。


以右表为准:保留右表所有值

我们看下合并效果:右表(下左)的总行数是28666,合并后(下右)有28666行,那么为什么这次的结果行数和右表的行数是一样的呢?


首先,结果中包含了原右表的所有值。同时,左表中的对应列没有重复的基因,所以合并过程中行不会增加。另外,因为我们选了以右表为准,即使一个基因在右表中有而左表中没有,这一行也不会删除,所以合并后的总行数最少和右表的行数是一致的。


取两表并集:保留两表所有值

我们看下合并效果:左表(上左)的总行数是60612,右表(上右)的总行数是628666,合并后(下)有81503行。合并后的文件总行数超过了两表的总行数,有两种原因:1.重复基因;2.两表的基因并不完全重合,有些基因有表达量无注释,有些基因有注释但是没有测到。


取两表交集:保留两表共有值

我们看下合并效果:左表(上左)的总行数是60612,右表(上右)的总行数是628666,合并后(下)有28666行。在此案例中,取交集的意义是,保留既有差异分析结果,也有基因注释的基因。


结果下载

最后点击按钮就可以下载啦



拓展说明

本文以做基因注释为例,在实际应用过程中,此工具的应用场景非常广泛,只要您的两表有一列是同类信息就可以合并。




还有什么想开发的云工具,可填写此调查问卷,选中并上线的话有机会免费获得联川生物书籍一本哦:https://www.wenjuan.com/s/UZBZJvPSgg/?is=qrcode


联川书籍:https://weidian.com/?userid=1659112072&wfr=c&ifr=itemdetail&source=shop&sfr=app


联川生物云平台主页:https://www.omicstudio.cn/index


云平台精选资料汇总:https://mp.weixin.qq.com/s/rP_m-O8FTmG6DXr4rbE74w


相关阅读

【疯狂7月】①—免费在线小工具:fasta序列提取 | 云平台

【疯狂7月】②—免费在线小工具:表格信息筛选 | 云平台

【疯狂7月】③—免费在线小工具:表格ID信息去重  | 云平台

Mantel Test:菌群与环境因子相关性分析 | 云平台
相关性系数图做成这样就一定是生物学重复不好么?| 云平台


点击下方图片进入云平台资料汇总:


所见即所得,figure有bi格

联川云平台,让科研更自由




继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存